<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN">
<HTML>
<HEAD>
<LINK REL=STYLESHEET TYPE="text/css" HREF="../stylesheet.css" TITLE="Style">
<META NAME="GENERATOR" CONTENT="Java2HTML Version 1.5">
<TITLE>hochschulen.HsStuttgart (Java2HTML)</TITLE>
</HEAD>
<BODY><TABLE id="Header" border="0" cellpadding="0" cellspacing="0" width="100%">
<tr>
<td colspan="2" width="33%">&nbsp;</td>
<td align="center" colspan="2" width="33%">
<font size="4">HsStuttgart.java</font>
</td>
<td align="right" colspan="2" width="33%">&nbsp;</td>
</tr>
</TABLE>
<pre ID="Classes">
<FONT ID="LN">1   </FONT><A NAME="1"></A><FONT ID="Package">package</FONT> hochschulen;
<FONT ID="LN">2   </FONT><A NAME="2"></A>
<FONT ID="LN">3   </FONT><A NAME="3"></A><FONT ID="Import">import</FONT> java.net.MalformedURLException;
<FONT ID="LN">4   </FONT><A NAME="4"></A><FONT ID="Import">import</FONT> java.util.ArrayList;
<FONT ID="LN">5   </FONT><A NAME="5"></A><FONT ID="Import">import</FONT> java.util.List;
<FONT ID="LN">6   </FONT><A NAME="6"></A>
<FONT ID="LN">7   </FONT><A NAME="7"></A><FONT ID="Import">import</FONT> <A HREF="../myWebCrawler/CrawlJsoup.java.html">myWebCrawler.CrawlJsoup</A>;
<FONT ID="LN">8   </FONT><A NAME="8"></A>
<FONT ID="LN">9   </FONT><A NAME="9"></A><FONT ID="Import">import</FONT> org.jsoup.nodes.Document;
<FONT ID="LN">10  </FONT><A NAME="10"></A><FONT ID="Import">import</FONT> org.jsoup.nodes.Element;
<FONT ID="LN">11  </FONT><A NAME="11"></A><FONT ID="Import">import</FONT> org.jsoup.select.Elements;
<FONT ID="LN">12  </FONT><A NAME="12"></A>
<FONT ID="LN">13  </FONT><A NAME="13"></A>
<FONT ID="LN">14  </FONT><A NAME="14"></A><FONT ID="Public">public</FONT> <FONT ID="Class">class</FONT> HsStuttgart <FONT ID="Extends">extends</FONT> <A HREF="../hochschulen/HsSalting.java.html">HsSalting</A> <FONT ID="Implements">implements</FONT> <A HREF="../hochschulen/HsSaltingInterface.java.html">HsSaltingInterface</A>{
<FONT ID="LN">15  </FONT><A NAME="15"></A>
<FONT ID="LN">16  </FONT><A NAME="16"></A>    @Override
<FONT ID="LN">17  </FONT><A NAME="17"></A>    <FONT ID="Public">public</FONT> List&lt;String&gt; startCrawler(<A HREF="../myWebCrawler/CrawlJsoup.java.html">CrawlJsoup</A> crawler) {
<FONT ID="LN">18  </FONT><A NAME="18"></A>
<FONT ID="LN">19  </FONT><A NAME="19"></A>        List&lt;String&gt; urlList = <FONT ID="Null">null</FONT>;
<FONT ID="LN">20  </FONT><A NAME="20"></A>        List&lt;String&gt; domList = <FONT ID="New">new</FONT> ArrayList&lt;String&gt;();
<FONT ID="LN">21  </FONT><A NAME="21"></A>
<FONT ID="LN">22  </FONT><A NAME="22"></A>        <FONT ID="Try">try</FONT> {
<FONT ID="LN">23  </FONT><A NAME="23"></A>            urlList = <FONT ID="This">this</FONT>.getLinks();
<FONT ID="LN">24  </FONT><A NAME="24"></A>        } <FONT ID="Catch">catch</FONT> (MalformedURLException e) {
<FONT ID="LN">25  </FONT><A NAME="25"></A>            e.printStackTrace();
<FONT ID="LN">26  </FONT><A NAME="26"></A>        }
<FONT ID="LN">27  </FONT><A NAME="27"></A>
<FONT ID="LN">28  </FONT><A NAME="28"></A>        <FONT ID="For">for</FONT> (String i : urlList) {
<FONT ID="LN">29  </FONT><A NAME="29"></A>            domList.addAll(crawler.paresContent(<FONT ID="This">this</FONT>, i));
<FONT ID="LN">30  </FONT><A NAME="30"></A>        }
<FONT ID="LN">31  </FONT><A NAME="31"></A>
<FONT ID="LN">32  </FONT><A NAME="32"></A>        <FONT ID="Return">return</FONT> domList;
<FONT ID="LN">33  </FONT><A NAME="33"></A>    }
<FONT ID="LN">34  </FONT><A NAME="34"></A>
<FONT ID="LN">35  </FONT><A NAME="35"></A>    @Override
<FONT ID="LN">36  </FONT><A NAME="36"></A>    <FONT ID="Public">public</FONT> List&lt;String&gt; getLinks() <FONT ID="Throws">throws</FONT> MalformedURLException {
<FONT ID="LN">37  </FONT><A NAME="37"></A>        List&lt;String&gt; pathList = <FONT ID="New">new</FONT> ArrayList&lt;String&gt;();
<FONT ID="LN">38  </FONT><A NAME="38"></A>        <FONT ID="If">if</FONT> (<FONT ID="This">this</FONT>.links == <FONT ID="Null">null</FONT>) {
<FONT ID="LN">39  </FONT><A NAME="39"></A>
<FONT ID="LN">40  </FONT><A NAME="40"></A>            pathList.add(<FONT ID="StringLiteral">"http://www.hft-stuttgart.de/Hochschule/Organisation/Professoren/FakC/index.html/de"</FONT>);
<FONT ID="LN">41  </FONT><A NAME="41"></A>        } <FONT ID="Else">else</FONT> {
<FONT ID="LN">42  </FONT><A NAME="42"></A>            pathList = <FONT ID="This">this</FONT>.links;
<FONT ID="LN">43  </FONT><A NAME="43"></A>        }
<FONT ID="LN">44  </FONT><A NAME="44"></A>        <FONT ID="Return">return</FONT> pathList;
<FONT ID="LN">45  </FONT><A NAME="45"></A>    }
<FONT ID="LN">46  </FONT><A NAME="46"></A>
<FONT ID="LN">47  </FONT><A NAME="47"></A>    @Override
<FONT ID="LN">48  </FONT><A NAME="48"></A>    <FONT ID="Public">public</FONT> ArrayList&lt;Elements&gt; parseContent(Document doc) {
<FONT ID="LN">49  </FONT><A NAME="49"></A>
<FONT ID="LN">50  </FONT><A NAME="50"></A>        ArrayList&lt;Elements&gt; e = <FONT ID="New">new</FONT> ArrayList&lt;Elements&gt;();
<FONT ID="LN">51  </FONT><A NAME="51"></A>
<FONT ID="LN">52  </FONT><A NAME="52"></A>        Elements links = doc.select(<FONT ID="StringLiteral">"a"</FONT>);
<FONT ID="LN">53  </FONT><A NAME="53"></A>        <FONT ID="SingleLineComment">//.select("body &gt; table &gt; tbody &gt; tr:nth-child(297) &gt; td.webkit-line-content &gt; span:nth-child(2) &gt; a");
<FONT ID="LN">54  </FONT><A NAME="54"></A></FONT>
<FONT ID="LN">55  </FONT><A NAME="55"></A>        <FONT ID="For">for</FONT> (Element element : links) {
<FONT ID="LN">56  </FONT><A NAME="56"></A>            <FONT ID="If">if</FONT>(element.text().contains(<FONT ID="StringLiteral">"@"</FONT>)){
<FONT ID="LN">57  </FONT><A NAME="57"></A>                <FONT ID="SingleLineComment">//e.add(links);
<FONT ID="LN">58  </FONT><A NAME="58"></A></FONT>                <FONT ID="SingleLineComment">//System.out.println(element.text());
<FONT ID="LN">59  </FONT><A NAME="59"></A></FONT>            }
<FONT ID="LN">60  </FONT><A NAME="60"></A>        }
<FONT ID="LN">61  </FONT><A NAME="61"></A>        Elements prof = doc.select(<FONT ID="StringLiteral">"div[id=Proftab]"</FONT>).select(<FONT ID="StringLiteral">"a"</FONT>);
<FONT ID="LN">62  </FONT><A NAME="62"></A>        <FONT ID="SingleLineComment">//System.out.println("prof: " + prof.text());
<FONT ID="LN">63  </FONT><A NAME="63"></A></FONT>        <FONT ID="SingleLineComment">//e.add(prof);
<FONT ID="LN">64  </FONT><A NAME="64"></A></FONT>        
<FONT ID="LN">65  </FONT><A NAME="65"></A>        String str = <FONT ID="Null">null</FONT>;
<FONT ID="LN">66  </FONT><A NAME="66"></A>        <FONT ID="Int">int</FONT> index = <FONT ID="IntegerLiteral">0</FONT>;
<FONT ID="LN">67  </FONT><A NAME="67"></A>        <FONT ID="For">for</FONT> (Element element : prof) {
<FONT ID="LN">68  </FONT><A NAME="68"></A>            str = element.toString().substring(<FONT ID="IntegerLiteral">9</FONT>);
<FONT ID="LN">69  </FONT><A NAME="69"></A>            str = <FONT ID="StringLiteral">"http://www.hft-stuttgart.de"</FONT>+str;
<FONT ID="LN">70  </FONT><A NAME="70"></A>            
<FONT ID="LN">71  </FONT><A NAME="71"></A>            index = str.indexOf(<FONT ID="StringLiteral">"&gt; "</FONT>);
<FONT ID="LN">72  </FONT><A NAME="72"></A>            str = str.substring(<FONT ID="IntegerLiteral">0</FONT>, index-<FONT ID="IntegerLiteral">1</FONT>);
<FONT ID="LN">73  </FONT><A NAME="73"></A>            
<FONT ID="LN">74  </FONT><A NAME="74"></A>            <FONT ID="SingleLineComment">//System.out.println(str);
<FONT ID="LN">75  </FONT><A NAME="75"></A></FONT>            <FONT ID="SingleLineComment">//e.add(prof);
<FONT ID="LN">76  </FONT><A NAME="76"></A></FONT>        }
<FONT ID="LN">77  </FONT><A NAME="77"></A>        
<FONT ID="LN">78  </FONT><A NAME="78"></A>        Elements email = doc.select(<FONT ID="StringLiteral">"#Tabelle &gt; table &gt; tbody &gt; tr:nth-child(3) &gt; td:nth-child(2) &gt; a"</FONT>);
<FONT ID="LN">79  </FONT><A NAME="79"></A>        <FONT ID="SingleLineComment">//System.out.println(email.text());
<FONT ID="LN">80  </FONT><A NAME="80"></A></FONT>        <FONT ID="SingleLineComment">//.select("body &gt; table &gt; tbody &gt; tr:nth-child(297) &gt; td.webkit-line-content &gt; span:nth-child(2) &gt; a");
<FONT ID="LN">81  </FONT><A NAME="81"></A></FONT>        <FONT ID="SingleLineComment">//e.add(email);
<FONT ID="LN">82  </FONT><A NAME="82"></A></FONT>        Elements fak = doc.select(<FONT ID="StringLiteral">"#Tabelle &gt; table &gt; tbody &gt; tr:nth-child(7) &gt; td:nth-child(2)"</FONT>);
<FONT ID="LN">83  </FONT><A NAME="83"></A>        System.out.println(fak.text());
<FONT ID="LN">84  </FONT><A NAME="84"></A>        e.add(fak);
<FONT ID="LN">85  </FONT><A NAME="85"></A>
<FONT ID="LN">86  </FONT><A NAME="86"></A>        <FONT ID="SingleLineComment">//Elements email = doc.select("a[class=font-size-11]");
<FONT ID="LN">87  </FONT><A NAME="87"></A></FONT>
<FONT ID="LN">88  </FONT><A NAME="88"></A>        <FONT ID="Return">return</FONT> e;
<FONT ID="LN">89  </FONT><A NAME="89"></A>    }
<FONT ID="LN">90  </FONT><A NAME="90"></A>}
<FONT ID="LN">91  </FONT><A NAME="91"></A></pre>
</BODY>
</HTML>